いざ入ってみたら——20℃の水風呂だった。
パンフレットは嘘をついていない。でも、真実も語っていなかった。
もちろん嘘の話です。そんなサイトあるわけがない。しかし、少なからず、平均値には騙されやすいのが私たちです。
実は、データに騙される経験は、誰もが日常的にしています。 会議室の売上報告、学校のテストの平均点、ダイエット食品の「平均-3kg」という広告。これらのほとんどは、「平均値」という便利な数字で、不都合な真実を覆い隠しています。
ここで、お伝えしたいのは、そのカラクリを見抜くたった一つの武器——「標準偏差(バラツキ)」です。数式はゼロ。でも、読み終わった後には確実に世界の見え方が変わります。
1. 「平均42℃」の二つの実在しない温泉街——平均水温が同じでも、、
温泉旅行を計画しているとしましょう。候補は二つの温泉街。どちらのパンフレットにも同じ文字が目に入ります。
「源泉の平均水温:42℃(快適な湯加減)」
こんなパンプレット見たことないっと思ったあなた、もう少し話に付き合ってください。
さあ、どちらを選びますか? もし隠れた源泉データが下記のようでしたら、、、
🏔️ 温泉街 A「安定の湯」
🎰 温泉街 B「運命の湯」
平均は同じ42℃。でも、Bに行けば3分の2の確率で地獄を見ます。
パンフレットの数字は正確でした。でも、「平均値しか書かなかった」ことで、本当に大事な情報——データのバラツキ——は隠れてしまいました。
2. 「バラツキ」を一つの数字で表す——それが標準偏差
この「散らばり具合」を定量化したものが、標準偏差(英語では Standard Deviation、略して SD または σ(シグマ))です。
- 標準偏差が小さい → データが平均の近くに集中している(=安定・予測しやすい)
- 標準偏差が大きい → データが平均から大きく離れている(=不安定・リスクが高い)
二つの温泉街の「分布の形」を視覚化すると、その違いは一目でわかります。
データの分布の違い——A市 vs B市(どちらも平均42℃)
青い山(A市)は42℃に集中。赤い山(B市)は同じ平均でも、両端に「外れ値」が多い。
A市の分布は42℃を中心に鋭く集まっています。B市は同じ平均でも、広くなだらかに広がり、端には水風呂と熱湯が潜んでいます。山の「とがり具合」が、標準偏差の大小を表しています。
3. 他の話で考えてみる
温泉の話はおいといて、「どう使うの?」
上司が言う。「今月の1日平均売上は10万円でした」
——ちょっと待ってください。その「10万円」が、毎日コンスタントに稼いだ10万円なのか、
月末に大口契約が1件入って平均を押し上げただけなのかで、
会社の実態はまったく違います。
標準偏差が大きければ「たまたま」、小さければ「実力」。
「平均」の隣に「バラツキ」がなければ、その数字は半分しか語っていない。
平均点50点のテストで、あなたは60点を取った。
クラス全員が45〜55点に集まる「差がつかないテスト」(σ小)なら、
あなたの60点は圧倒的トップ。
でも、10点〜90点まで散らばるテスト(σ大)なら、
60点はごく平凡かもしれない。
実はこれ、「偏差値」の仕組みそのものです。
偏差値とは、標準偏差を使って「自分が全体のどこにいるか」を示した数字。
偏差値50=平均ちょうど。偏差値60=平均より標準偏差1個分上にいる、という意味です。
4. 計算はExcelに全部任せる——人間がやるのは「読む」だけ
「標準偏差の計算式が複雑そう……」という心配は無用です。現代では、この計算を人間がする理由はありません。
Excelでの計算(コピペするだけ)
カッコ内にデータの範囲を入れるだけ。一瞬でσが出ます。
※ STDEV.Pはデータ全体が手元にある場合(母標準偏差)。
サンプルデータの場合は STDEV.S を使います。
計算は機械に任せて、人間がやるべきことは一つ。「この標準偏差の値を見て、何を意味するか判断する」——この読み解く力が、データリテラシーの本質です。
まとめ——「平均値+標準偏差」がデータを見る最小単位
平均だけでは足りない
同じ平均でも、バラツキが違えばリスクは天と地ほど違う
標準偏差を確認する
「平均○○」の隣に「σ(バラツキ)」がなければ、その数字は不完全
計算はExcelに任せるSTDEV.P() 一発。人間がやるのは「読み解くこと」だけ